多伦多大学:多模态AI的“视力”和“文字理解”为何不在一个频道上? 当我们看到一张棋盘照片和一串看起来像天书一样的字母数字组合"rnbqkbnr/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR"时,可能很难相信它们其实在描述完全相同的信息——同一个国际象棋开局位置。然而,这正是多伦多大学计算机科学系的唐振 模态 视力 国际象棋 多伦多大学 seam 2025-09-04 17:29 5